Protein

Browse of TCMCG075C04854 protein

CDS


Accession Number	TCMCG075C04854
gbkey	CDS
Protein Id	XP_017970092.1
Location	complement(1633447..1634829)
Gene	LOC18607262
GeneID	18607262
Organism	Theobroma cacao

Protein


Length	460aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA341501
db_source	XM_018114603.1
Definition	PREDICTED: crocetin glucosyltransferase, chloroplastic [Theobroma cacao]

EGGNOG-MAPPER Annotation


COG_category	CG
Description	Belongs to the UDP-glycosyltransferase family
KEGG_TC	-
KEGG_Module	-
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko01000 [VIEW IN KEGG] ko01003 [VIEW IN KEGG]
KEGG_ko	ko:K21371 [VIEW IN KEGG]
EC	2.4.1.271 [VIEW IN KEGG] [VIEW IN INGREDIENT]
KEGG_Pathway	-
GOs	-

Sequence

CDS:
ATGAGTTCGGATGATCCCCACTTCCTCCTTGTAACCTTGCCTGGCCAAGGCCACCTAAACCCAACTCTCCAGCTAGCAAAGCGCCTGATCCAGGCCGGTGCACGCGTCACTTTTGCCACCACCACTTCTGGCCAACGGAAAATCAAAAGTTTCCCTTCTCTCGAGGGCTTAGCGTATGCCTTTTTTTCTGACGGATTCGATGATGGAACTTCTCCGTCTGACAAACAGGAGGATATTATGTCCAAACTCGAGCATATCGGGTCCCAAACTCTAACCAACCTACTGCTGAGCTTGTCTGGTGAAGGCCATCCGGTAAGTTTCTTGATATATAGTCTCTTGCTGTCTTGGGTCGCTGATGTGGCTCGGGACTTGTCCATTCCTTCTGCTTTACTCTGCAATCATAGTGGTGCTGCGTTCGCTATCTACCACCATTACCTCAATAGCCAAACAGGGGCTTATGATTCTAAAATCAATTGCCCTCCAAGCTTCATAAACTTTGAAGGGTTGCCTCCATTTAAATGGAAAGACCTGCCTTCTTTTCTGTTACCATACAGTCCACACTCTTTTGTCACGACTAACTTTCAAAAACACATTCGAGTTCTGGAAAAAGACCCTAATCCTTGTGTTCTTATAAACACCTTTGATGAGCTAGAAGAATATGCAATCAAAACCCTTGCTCATGATTCCAACATAAACTTGATCACCATCGGACCCTTGGTTCCATCAGACAAATTCGTTGGCTGTGATTTGTTTGAGAACTCTAGTCATGACTATTATACCCATTGGTTGGATTCCAAGCCTGATTGTTCAGTTGTTTACATTTCCTTTGGTAGCCTGGCAGTATTGCCGAGGAATCAAATGGAAGAAATTTTTCATGGAATAGTTGATAGTGGCTACACATTCTTATGGGTAATCCGACCATCAAAAGATGGAGAAGAAGAAGAAGGATTCGAGAATGCGATCAAAGATAAGATAAAGGAAGAACAAGGGCTGATTGTTCCATGGTGTTCACAAGTTGAAGTGTTGAATCACCGGGCGGTAGGTTGTTTTGTGACGCATTGCGGGTGGAACTCCACTACGGAGTGCTTGGTTGCAGGCGTGCCAATGGTTGCATTGCCTCAGTTTTCAGATCAGACCACGAACGCAAAGCTAGTAGACGAGGTATGGGAAACTGGCATTAGAATTAAAGTAAATGAAGGTACTGCAGTTGCAGAGAAGGAAGAGATCAGAAGGTGCTTGGAGATGGTAATGGGAAATGGACAGAAAGGGGAAGCAATGAGAGGGAAAGCTAAGAAGTGGAGAGGATTGGCTCTCGAGGCGACGAGTCAAGGCGGTTCCTCGGCCAATAATTTCAAGGTTTTCATGGAAAGCTTTGTCAAGTGA

Protein:
MSSDDPHFLLVTLPGQGHLNPTLQLAKRLIQAGARVTFATTTSGQRKIKSFPSLEGLAYAFFSDGFDDGTSPSDKQEDIMSKLEHIGSQTLTNLLLSLSGEGHPVSFLIYSLLLSWVADVARDLSIPSALLCNHSGAAFAIYHHYLNSQTGAYDSKINCPPSFINFEGLPPFKWKDLPSFLLPYSPHSFVTTNFQKHIRVLEKDPNPCVLINTFDELEEYAIKTLAHDSNINLITIGPLVPSDKFVGCDLFENSSHDYYTHWLDSKPDCSVVYISFGSLAVLPRNQMEEIFHGIVDSGYTFLWVIRPSKDGEEEEGFENAIKDKIKEEQGLIVPWCSQVEVLNHRAVGCFVTHCGWNSTTECLVAGVPMVALPQFSDQTTNAKLVDEVWETGIRIKVNEGTAVAEKEEIRRCLEMVMGNGQKGEAMRGKAKKWRGLALEATSQGGSSANNFKVFMESFVK

Browse of TCMCG075C04854 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence